@火凤凰
2年前 提问
1个回答

大数据典型隐私保护技术手段包括哪些

Anna艳娜
2年前

大数据典型隐私保护技术手段包括以下这些:

  • 抑制:抑制是最常见的数据匿名措施,通过将数据置空的方式限制数据发布。

  • 泛化:泛化是指通过降低数据精度来提供匿名的方法。属性泛化即通过制定属性泛化路径,将一个或多个属性的不同取值按照既定泛化路径进行不同深度的泛化,使得多个元组的属性值相同。最深的属性泛化效果通常等同于抑制。社交关系数据的泛化则是将某些节点以及这些节点间的连接进行泛化。位置轨迹数据可进行时间、空间泛化。

  • 置换:置换方法不对数据内容作更改,但是改变数据的属主。例如,将不同的个人用户的属性值互相交换,将用户a与b之间的边置换为a与c之间的边。

  • 扰动:扰动是在数据发布时添加一定的噪声,包括数据增删、变换等,使攻击者无法区分真实数据和噪声数据,从而对攻击者造成干扰。

  • 裁剪:裁剪技术的基本思想是将数据分开发布。例如,对于表结构数据,首先将用户划分为不同的组,赋予同一组的记录相同的组标识符(group id),对应记录的敏感数据也赋予相同的组标识符,然后将准标识符(如地域、性别等)和敏感数据分别添加组标识符作为两张新表发布。恶意攻击者即使可以确定攻击目标的组标识符,但是无法有效地从具有相同组标识符的敏感数据中判定攻击目标对应的敏感数据。

  • 密码学:密码学手段利用数据加密技术阻止非法用户对数据的未授权访问和滥用。